草庐IT

python - 结合 itertools 和多处理?

全部标签

python - 使用 Python 转义 _xHHHH_ XML 转义序列

我正在使用Python2.x[不可协商]读取XML文档[由其他人创建],这些文档允许许多元素的内容包含通过使用_xHHHH_约定例如ASCIIBELakaU+0007由7个字符序列u"_x0007_"表示。允许在文档中表示任何旧字符的功能和转义方式都是不可协商的。我正在使用cElementTree或lxml[semi-negotiable]解析文档。这是我尽可能有效地对解析器输出进行转义的最佳尝试:importredefunescape(s,subber=re.compile(r'_x[0-9A-Fa-f]{4,4}_').sub,repl=lambdamobj:unichr(int(

python - 在 XML 节点中设置自增属性

我正尝试在我的XML的一个节点中设置一个属性,如下所示:rank=1forphotoins:image=feed.createElement('Image')images.appendChild(image)image.setAttribute("rank",rank)p=feed.createTextNode(str(main_url+photo.display.url))image.appendChild(p)rank+=1然而,这会导致错误:'int'objecthasnoattribute'replace'inreferencetotheline:image.setAttrib

python - 生成/写入 XML 文件的标准方式

对于一个项目,我需要生成符合特定格式的XML文件。我想知道,这样做的标准方法是什么?就我而言,我使用lxml然后编写XML文件。为此,我编写了一个小脚本,将XML数据作为输入,然后生成文件。这种做法“可行”吗?因为我对这一切都不熟悉,而且我看到很多人使用TeX,然后将其转换为XML。或者是否有更好的方法完全做到这一点?编辑:请注意,我必须允许最终用户生成这些文件,而不需要他们做任何努力。 最佳答案 对于python3:http://diveintopython3.org/xml.html#xml-parse

xml - Web 浏览器是否处理 "xmlns"属性?

在W3schools上有一篇关于XMLNamespaces的文章状态:注意:命名空间URI不被解析器用来查找信息我有一个非常简单的XML文件:Hi!ClickMe!在Chrome或Firefox中打开此文件会显示一个HTML按钮(不在IE中)。这是否意味着某些浏览器处理XMLNS?这是浏览器为通用XHTMLnamespace提供的那些“额外/不错”功能之一吗?只是好奇! 最佳答案 首先要注意的是,您在依赖W3School获取信息之前应该小心——那里的很多信息都是伪造的,或者解释不当。关于您的具体问题:大多数现代浏览器都会考虑命名空间

python - 保持属性顺序的 XML 解析器编写器

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭3年前。Improvethisquestion我需要解析XML文档,然后将每个节点写入单独的文件,以保持属性的准确顺序。所以如果我有这样的输入文件:每个项目的输出应该是2个文件。现在,如果使用xml.dom.minidom-输出中的属性顺序已更改(我可以得到-)我找到了pxdom库,它保持顺序但非常非常慢(minidom解析需要0.08秒,pxdom解析需要2.5秒。)有没有其他可以保留属性的python库?UP

python - dateTime 提示 XSD 验证中的空白 (lxml)

我正在尝试使用XSD验证文档,而lxml提示dateTime值中的空白(尽管它应该折叠它)。我不确定这是否是一个错误的行为,或者我是否只是在XSD中指定了错误的地方。花了一个小时尝试对此进行调试,希望其他人之前经历过类似的行为。======================================================================ERROR[0.076s]:test_exports(disqus.importer.tests.tests.SchemaValidation)----------------------------------------

python - ElementTree XPath 奇怪的行为

你好我在Python2.7中使用ElementTree(1.3)并享受XPath功能,然而,其中一个搜索结果让我感到惊讶。我的XML示例:问题一:当我使用findall获取第一个找到的元素时version="2.2.0.0"found=list(txml.findall(".//BackEnd[@version='%s']"%version))returnfoundandfound[0]orNone它什么也没找到。然而,当我更改XML文件时,BackEnd元素包含子元素,然后正确找到搜索到的元素。你遇到过这样的行为吗?我是不是做错了什么或者这是ElementTree实现中的错误?问题二

python - 如何使用任何 xml 库替换节点的全部内容?

我正在尝试使用Python解析xml文件,但我有一些标签可能包含xml数据。例如:我想这样写CDATA标签:]]>我试过(使用lxml):a=etree.fromstring(data)foreina.findall("code"):e.text=etree.CDATA(etree.tostring(e))但是我得到:]]> 最佳答案 您的替换代码找到了元素并将其序列化为元素的新文本​​。您似乎只想包含的子元素,虽然。尝试设置e.text至CDATA(e.text)而不是序列化e的结果.

ruby-on-rails - 在 Builder::XmlMarkup 中处理异常

我想知道在使用Ruby的XML构建器生成大型XML提要时处理错误的最佳做法是什么?我遇到的问题是我正在将数百万条记录写入一个XML文件,并且由于数据质量,有些可能会失败。但是,我不希望构建器因为单个失败记录而终止。这是说明问题的片段:xml=Builder::XmlMarkup.newxml.outerdobeginxml.innerdoxml.text"content"raise"yourhands"endrescueputs"howshouldthisbehandled?"endend这将输出以下XML:content这是无效的,因为永远不会关闭。我该如何正确执行此操作?

python - 如何输出 XML 实体引用

我正在使用Pythonxml.etree.ElementTree输出XML。我想用实体引用输出它,这些实体引用将在解析XML时被替换。通常'&'被转义为&因为'&'用于声明实体引用。但是,我真的想写一个实体引用。例如,我想编写一个包含实体引用&manifestName;的XML文件:>>>fromxml.etree.ElementTreeimportElement,tostring>>>manifest=Element('manifest')>>>manifest.text='&manifestName;'>>>tostring(manifest)返回一个转义的符号:'&man